BAB2
(PENGOLAHAN & PEMAPARAN
DATA)
Pengolahan Data:
q
Langkah pertama dlm analisis data adalah pengolahan data mentah
& dipaparkan dlm illustrusi
yg boleh difahami.
Pemerihalan Data illustrusi:
1.
Gambarajah dot
q
mudah & tak sesuai utk. data yg. banyak
q
dapat menunjukkan lokasi pusat data & serakan data
q
contoh:
q
dlm gambarajah dot ini, data berpusat sekitar 66 &67 & serakan
data 63-70.
2.
Histogram
q
Paling popular digunakan
q
Sesuai utk data yg banyak & besar.
3.
Poligon
q
Jika titik tengah bar histogram disambungkan, poligon terhasil
q
Poligon dpt memberikan bentuk taburan data.
4.
Ogif
q
Ogif dibina berbeza dgn histogram atau poligon di mana paksi-y adalah
kekerapan kumulatif.
5. Lain-lain
q
Carta Bar (Mudah & Carta Perkadaran)
q
Carta pai
Contoh Pembinaan Histogram:
q
Data panjang 40 cengkerang sejenis siput dipantai (mm)
9 |
19 |
25 |
23 |
8 |
19 |
20 |
13 |
23 |
27 |
12 |
26 |
21 |
24 |
15 |
17 |
17 |
27 |
31 |
23 |
18 |
20 |
25 |
14 |
18 |
22 |
26 |
28 |
14 |
29 |
21 |
19 |
26 |
23 |
28 |
16 |
34 |
22 |
30 |
25 |
q Langkah pertama susun data
mengikut urutan menaik.
q Kita “kecilkan” data dgn
membina jadual taburan kekerapan.
q Tentukan bilangan kelas yg
sesuai antara 5 –15
q Anggarkan Lebar Kelas (LK)=(H-L)/K
dimana H=cerapan terbesar, K= cerapan terkecil dan K=bilangan kelas.
q H=34, L=8. Dgn K=7,
LK=(34-8)/7~3.7. Bulatkan kepada 4.
Maka boleh ambil kelas
1: 8 –11
Kelas
2:12 –15
Kelas
3:16 – 19
dsb.
Kerana pembolehubah panjang cengkerang adalah
selanjar, adalah sesuai menggunakan kelas selanjar berbanding kelas diskrit.
Contohnya guna 7.5 – 11.5 berbanding 8 – 11, dsb.
q
Bina jadual taburan kekerapan
Kelas |
Kekerapan(Bilangan Siput) |
Kekerapan Relatif (Bil. Siput/Jumlah Siput) |
7.5 – 11.5 |
2 |
0.05 |
11.5 – 15.5 |
5 |
0.125 |
15.5 – 19.5 |
8 |
0.2 |
19.5 – 23.5 |
10 |
0.25 |
23.5 – 27.5 |
9 |
0.225 |
27.5 – 31.5 |
5 |
0.125 |
31.5 – 35.5 |
1 |
0.025 |
q
Histogram boleh dibina drp jadual kekerapan ini.
q
Luas di bawah bar adalah kekerapan atau kekerapan relatif bagi kelas
berkenaan. Perhatikan jumlah atau kumulatif kekerapan relatif adalah 1.
q
Poligon dibina dgn menyambungkan titik tengah histogram di atas.
q
Jika bil. bar di tambah, lebar kelas menjadi kecil, poligon semakin
menjadi licin, menghampiri lengkungan.
q
Bentuk lengkungan menggambarkan bentuk taburan data
q
Dlm contoh di atas bentuknya adalah seperti loceng, hampir simetri;
Taburan berbentuk seperti ini dipanggil sebagai taburan normal.
q
Luas di bawah lengkungan juga kekerapan atau kekerapan relatif bagi kelas
berkenaan.
q
Selain dari berbentuk normal, taburan data mungkin pencong (ke kanan atau
ke kiri), atau mungkin mempunyai
dua bentuk iaitu bimodal.
Taburan Kebarangkalian:
q
Dlm kursus ini, kita akan merujuk kepada beberapa jadual TABURAN RUJUKAN;
seperti Taburan Normal, Taburan-t,
Taburan F
dan Taburan
c2.
q
Merupakan taburan kebarangkalian dgn bentuk ditentukan oleh fungsi
lengkungan kebarangkalian masing-masing.
q
Contohnya Taburan Normal, fungsi lengkungan kebarangkalian normal adalah
q Pembolehubah X dikatakan
bertaburan normal dengan min m dan sisihan piawai s.
q Bentuk taburan normal adalah
seperti loceng & simetri
q Jika ditakrifkan Z=X - m/s, maka pembolehubah Z dikatakan pembolehubah normal piawai dengan bentuk taburan
yang sama tetapi min sifar dan sisihan piawai 1.
q Paksi y rajah di atas adalah
kebarangkalian dan keluasan di bawah lengkungan adalah kebarangkalian dengan
jumlah keluasan di bawah lengkungan adalah 1. Kerana simetri luas di bawah
sebelah kanan min = luas di bawah sebelah kiri min.
q Perhatikan poligon di atas. Ada
persamaannya dgn bentuk taburan normal. Yg berbeza adalah paksi y adalah
kekerapan atau kekerapan relatif, bukannya kebarangkalian. “Kekerapan relatif”
boleh difikirkan sebagai anggaran kepada kebarangkalian.
q Taburan-taburan yang lain akan
diperkenalkan kemudian.